Analyse de la concentration

La fonction de concentration (chapitre 2) est définie sur l’intervalle [0, 1]. Elle associe à une proportion p la valeur C(p) définie par :

C(p) = S(p) / S

où S(p) est le cumul des p % valeurs observées les plus petites et S la somme de toutes les valeurs.

On note x(1), x(2), x(3), …, x(n) les observations rangées suivant les valeurs croissantes.

 

·        L’équiconcentration signifie que les termes sont constants et égaux à leur somme S divisée par le nombre d’observations. En effet, on a :

 

k = 1, p = 1/n

1/n

= x(1)/S

k = 2, p = 2/n

2/n

= [ x(1) + x(2)]/S

 

 

= x(1)/S + x(2)/S

 

 

= 1/n + x(2)/S

On obtient 1/n = x(2)/S et ainsi de suite.

·        La fonction C(p) est croissante et égale à 1 lorsque p = 1 (ou k = n). Cette propriété est évidente :

 

k

 

k’

 

pour tout k £ k’

S

x(i) £

S

x(i)

 

i = 1

 

i = 1

 

·        C(p) augmente de plus en plus vite. Considérons p = k/n , p’ = (k+1)/n et
p’’ = (k+2)/n . On a :

C(p’) – C(p)

= x(k+1)/S

C(p’’) – C(p’)

= x(k+2)/S

Les observations sont classées suivant les valeurs croissantes. On en déduit :

C(p’) – C(p) £ C(p’’)– C(p’)

·        C(p) est toujours inférieur à p, ce qui signifie que la courbe de concentration est toujours en dessous de la droite y = x.. C’est une démonstration par l’absurde un peu compliquée. Pour la simplifier, nous supposons tous les termes distincts.

Supposons C(p0) > p0 = k0/n . Si x(k0) est inférieur ou égal à S/n , on a, puisque les observations (toutes distinctes) sont classées suivant les valeurs croissantes :

pour tout i < k0

x(i) <S/n.

D’où :

 

k0

 

C(p0) =

S

x(i)/S < k0/n

 

i = 1

 

ce qui est impossible par hypothèse sur C(p0). Le terme x(k0) et les suivants sont donc supérieurs ou égaux à S/n .

 


Calculons maintenant la concentration en p = 1 (ou pour k = n) :

 

k0

 

n

 

 

S

x(i) +

S

x(i)]

 

i = 1

 

i = k0+1

 

C[n/n] = C(1)=

_________

_________

___________

_______

 

 

n

 

 

 

 

S

x(i)

 

 

 

i = 1

 

 

                                                              > C(p0) + (n – k0)/n

                                                              > k0/n + ( n – k0)/n = 1

 

La dernière inégalité étant impossible, on a toujours C(p0)£ p0.